智能论文笔记

The MIS Check-Dam Dataset for Object Detection and Instance Segmentation Tasks

Chintan Tundia , Rajiv Kumar , Om Damani , G. Sivakumar

分类：计算机视觉

2021-11-30

在其他计算机视觉任务中，深入学习导致对象检测和实例分割的最近进步。这些进步导致广泛的基于学习方法和相关方法的广泛应用于卫星图像的对象检测任务中。在本文中，我们介绍了MIS检查水坝，从卫星图像中的卫星图像进行新数据集，用于构建用于检查和映射的自动化系统，专注于用于农业的灌溉结构的重要性。我们审查了一些最新的对象检测和实例分段方法，并在我们的新数据集中评估其性能。我们根据各种网络配置和骨干架构评估了几个基于单级，两阶段和注意的方法。数据集和预训练型号可在https://www.cse.iitb.ac.in.in/gramdridisti/上获得。

translated by 谷歌翻译

Customer Empowered Privacy-Preserving Secure Verification using Decentralized Identifier and Verifiable Credentials For Product Delivery Using Robots

Chintan Patel

分类：机器人

2022-08-12

在Covid 19等呼吸道疾病时代，我们了解基于机器人的交付系统的必要性，以确保安全和免费的快递交付。基于区块链的动态标识符为人们提供了对其身份的全部权力，同时保留可审核性和匿名性。人类手机和机器人是用芯片创建的机器，使在机器人和客户之间部署基于物理功能的验证系统变得容易。本文介绍了一个新颖的框架和第一个客户验证方案，用于使用启用区块链DID和启用PUF的机器人进行验证的快递交付。我们雇用了机器人（服务提供商）与客户和PUF之间的客户身份验证的DAID，以对机器人验证。我们还将拟议的工作付诸实践，并在吞吐量，延迟，计算成本和沟通成本方面证明了其能力。我们还根据tamarin供奉献者展示了建议的用户验证方案的正式安全证明。

translated by 谷歌翻译

Game State Learning via Game Scene Augmentation

Chintan Trivedi , Konstantinos Makantasis , Antonios Liapis , Georgios N. Yannakakis

分类：计算机视觉

2022-07-04

对于任何游戏人工智能任务，包括游戏玩法，测试，玩家建模和程序内容生成，访问准确的游戏状态信息至关重要。自我监督的学习（SSL）技术已证明能够从游戏的高维像素输入到压缩潜在表示中从高维的像素输入中推断出准确的游戏状态信息。对比度学习是SSL的流行范式之一，其中对游戏图像的视觉理解来自与简单图像增强方法定义的不同和类似的游戏状态。在这项研究中，我们介绍了一种新的游戏场景增强技术（名为GameClr），该技术利用游戏引擎来定义和综合不同游戏状态的特定，高度控制的效果图，从而提高了对比性学习表现。我们在Carla驱动模拟器环境的图像上测试了GAMECLR对比度学习技术，并将其与流行的SIMCLR基线SSL方法进行比较。我们的结果表明，与基线相比，GAMECLR可以更准确地从游戏录像中推断游戏的状态信息。引入的方法使我们能够通过直接利用屏幕像素作为输入来进行游戏人工智能研究。

translated by 谷歌翻译

Revisiting lp-constrained Softmax Loss: A Comprehensive Study

Chintan Trivedi , Konstantinos Makantasis , Antonios Liapis , Georgios N. Yannakakis

分类：机器学习 | 计算机视觉

2022-06-20

归一化是任何机器学习任务的重要过程，因为它控制数据的属性并影响了整个模型性能。然而，迄今为止，特定形式的正常化形式的影响已在有限的特定领域分类任务中，而不是以一般方式进行了研究。由于缺乏这样的全面研究的激励，我们在本文中调查了LP受限的软性损失分类器在不同的规范订单，幅度和数据维度上的性能在概念证明分类问题和现实世界中流行图像分类中的性能任务。实验结果总共表明，LP受限的软磁损耗分类器不仅可以实现更准确的分类结果，而且同时似乎不太容易过度拟合。在测试的三个流行深度学习体系结构和八个数据集中，核心发现持续存在，并建议LP归一化是在性能和收敛性方面的图像分类的推荐数据表示实践，并且反对过度拟合。

translated by 谷歌翻译

Learning Task-Independent Game State Representations from Unlabeled Images

Chintan Trivedi , Konstantinos Makantasis , Antonios Liapis , Georgios N. Yannakakis

分类：计算机视觉

2022-06-13

自我监督学习（SSL）技术已被广泛用于从高维复杂数据中学习紧凑而有益的表示。在许多计算机视觉任务（例如图像分类）中，此类方法获得了超过监督学习方法的最新结果。在本文中，我们研究是否可以利用SSL方法来学习游戏的准确状态表示的任务，如果是的，则在多大程度上。为此，我们从三个不同的3D游戏中收集游戏镜头和游戏内部状态的相应序列：Vizdoom，Carla Racing Simulator和Google Research Football Eniversion。我们仅使用原始帧训练图像编码器，使用三种广泛使用的SSL算法训练图像编码器，然后尝试从学习的表示形式中恢复内部状态变量。与预训练的基线模型（例如ImageNet）相比，我们在所有三场游戏中的结果都显示了SSL表示与游戏内部状态之间的相关性明显更高。这样的发现表明，基于SSL的视觉编码器可以产生一般的一般 - 不是针对特定任务量身定制的 - 但仅从游戏像素信息中提供了信息丰富的游戏表示。这样的表示反过来可以构成增强游戏中下游学习任务的性能，包括游戏玩法，内容生成和玩家建模。

translated by 谷歌翻译